Cấu trúc Gen

The image above contains clickable linksCấu trúc của một gen mã hóa protein ở sinh vật nhân thực. Trình tự điều hòa kiểm soát ở đâu và vào lúc nào sự biểu hiện xảy ra đối với vùng mã hóa protein (đỏ). Vùng khởi động (promoter) và tăng cường (enhancer) (vàng) điều hòa phiên mã gen thành phân tử pre-mRNA mà được sửa đổi để loại bỏ các intron (xám nhạt) và thêm vào đầu 5' và đuôi poly-A (xám đậm). Các vùng không được dịch mã của mRNA là đầu 5' và đầu 3' (lam) điều hòa dịch mã thành chuỗi polypeptide trước khi thành sản phẩm protein cuối cùng.[43] 
The image above contains clickable linksCấu trúc của một operonsinh vật nhân sơ về gene mã hóa protein. Các trình tự điều hòa kiểm soát khi nào quá trình biểu hiện gen diễn ra đối với nhiều vùng mã hóa protein (đỏ). Các vùng promoter, operatorenhancer (vàng) điều hòa phiên mã gene thành một mRNA. Các vùng không dịch mã (lam) của mRNA điều hòa sự dịch mã thành các sản phẩm protein cuối cùng.[43] 

Cấu trúc của một gen chứa nhiều yếu tố mà những trình tự mã hóa protein thực sự chỉ là một phần nhỏ trong đó. Chúng bao gồm các vùng DNA không được phiên mã cũng như các vùng RNA không được dịch mã.

Tại hai bên khung đọc mở, mỗi gene chứa một trình tự điều hòa cần thiết cho sự biểu hiện của nó. Đầu tiên, gene cần một trình tự khởi động (promoter). Các yếu tố phiên mã (transcription factors) nhận ra và liên kết với vùng trình tự khởi động, sau đó RNA polymerase thực hiện khởi phát quá trình phiên mã.[37]:7.1 Việc nhận ra này thường nằm ở hộp TATA trong vùng khởi động. Một gene có thể có nhiều hơn một vùng khởi động, làm cho các RNA thông tin (mRNA) khác nhau ở độ dài của đầu 5'.[44] Những gene thường xuyên được phiên mã có những trình tự khởi động "mạnh" tức là tạo thành liên kết mạnh với các yếu tố phiên mã, do vậy khởi phát phiên mã ở tốc độ cao. Những gene khác có những vùng trình tự khởi động "yếu" mà liên kết yếu với các yếu tố phiên mã và do vậy sự phiên mã đối với các gen này xảy ra ít hơn.[37]:7.2 Các vùng trình tự khởi động ở sinh vật nhân thực có cấu trúc phức tạp hơn và khó nhận diện hơn so với ở sinh vật nhân sơ.[37]:7.3

Thêm vào đó, các gen có thể chứa những vùng điều hòa có độ dài hàng kilobase nằm ở bên trái hoặc bên phải khung đọc mở dẫn đến làm thay đổi mức độ biểu hiện. Những vùng này hoạt động bằng cách liên kết với các yếu tố phiên mã khiến cho DNA tạo thành mạch vòng do đó trình tự điều hòa (và yếu tố phiên mã bám vào) trở lên rất gần với RNA polymerase tại vị trí liên kết.[45] Ví dụ, các vùng tăng cường (enhancer) làm tăng tốc độ phiên mã bằng cách liên kết với một protein kích hoạt (activator protein) giúp kéo phân tử RNA polymerase đến vùng khởi động; ngược lại vùng bất hoạt (silencer) bám với protein ức chế (repressor protein) làm cho DNA trở lên ít hoạt động với RNA polymerase.[46]

Phân tử tiền mRNA (pre-mRNA) chứa những vùng không dịch mã ở cả hai đầu mà trong mỗi đầu chứa vị trí liên kết ribosome, vùng kết thúc (terminator) và các codon khởi đầucodon kết thúc.[47] Thêm vào đó, ở hầu hết khung đọc mở của sinh vật nhân thực chứa các đoạn intron không dịch mã mà sẽ được loại bỏ trước khi các đoạn exon được dịch mã. Các trình tự ở cuối mỗi intron, quyết định các vị trí cắt (splice site, RNA splicing) để tạo ra mRNA thành thục cuối cùng, dùng để mã hóa cho protein hoặc sản phẩm RNA khác.[48]

Nhiều gene ở sinh vật nhân sơ được tổ chức thành các đơn vị operon, với nhiều trình tự mã hóa protein được phiên mã nằm trong nó.[49][50] Các gene trong một operon được phiên mã như là một mRNA liên tục, mà coi nó như là polycistronic mRNA. Thuật ngữ cistron trong bối cảnh này tương đương với khái niệm gen. Sự phiên mã của một operon của mRNA thường bị kiểm soát bởi phân tử ức chế (repressor), mà trạng thái hoạt động hay bị cấm của sự phiên mã phụ thuộc vào sự có mặt những chất chuyển hóa nhất định.[51] Khi phân tử ức chế hoạt động, nó bám vào một trình tự DNA nằm ở vị trí khởi đầu của operon, được gọi là vùng operator, làm cản trở sự phiên mã của operon; khi phân tử ức chế bất hoạt, sự phiên mã ở operon có thể xảy ra (xem ví dụ Lac operon). Các sản phẩm của gene operon thường có những chức năng liên quan và tham gia vào cùng mạng lưới điều hòa gene.[37]:7.3

Định nghĩa theo chức năng

Các nhà sinh học phân tử gặp phải khó khăn khi muốn định nghĩa chính xác phần nào của một trình tự DNA chứa một gen.[7] Các vùng điều hòa của một gen như vùng tăng cường không cần thiết phải nằm gần với trình tự mã hóa trên mạch dài phân tử bởi vì các đoạn DNA trung gian có thể tạo vòng lồi ra (loop out) giúp mang gene và vùng trình tự điều hòa của nó đến gần nhau. Tương tự, các đoạn intron của một gen có thể dài hơn rất nhiều so với các đoạn exon của nó. Các vùng điều hòa thậm chí có thể nằm hoàn toàn trên nhiễm sắc thể khác và hoạt động từ xa (in trans) khi cho phép vùng điều hòa trên một nhiễm sắc thể đến gần với các gen đích nằm trên nhiễm sắc thể khác.[52][53]

Những nghiên cứu ban đầu trong di truyền phân tử gợi ra khả năng một gen tạo một protein. Khái niệm này (ban đầu gọi là giả thuyết một gen-một enzym) bắt nguồn từ bài báo có tầm ảnh hưởng năm 1941 bởi George Beadle và Edward Tatum công bố kết quả nghiên cứu các thí nghiệm gây đột biến trên nấm mốc bánh mỳ Neurospora crassa.[28] Norman Horowitz, một trong các cộng sự ban đầu tham gia vào nghiên cứu Neurospora, nhớ lại vào năm 2004 rằng “những thí nghiệm này là cơ sở của khoa học mà Beadle và Tatum từng gọi là di truyền sinh hóa. Thực sự các kết quả của họ đã khai sinh ra ngành di truyền phân tử và tất cả những phát triển sau đó.”[54] Khái niệm một gen-một protein đã được tinh chỉnh dần từ lúc khám phá ra các gen có thể mã hóa nhiều protein bằng quá trình điều hòa cắt-nối có chọn lọc (alternative splicing) và các trình tự mã hóa tách thành những đoạn ngắn trên bộ gene mà các mRNA được ghép nối bằng quá trình xử lý cắt-nối chéo (trans-splicing).[9][55][56]

Một định nghĩa có tầm hoạt động rộng thỉnh thoảng được sử dụng để bao quát được tính phức tạp của nhiều hiện tượng phong phú, nơi một gen được định nghĩa như là hợp của các trình tự mã hóa cho một tập nhất quán các sản phẩm chuyên biệt có khả năng xen phủ lẫn nhau.[20] Định nghĩa này phân loại gene theo các sản phẩm có chức năng riêng (như protein hay RNA) hơn là theo những vị trí locus cụ thể trên đoạn DNA, với các yếu tố điều hòa được phân loại như là các vùng kết hợp với gene.[20]

Tài liệu tham khảo

WikiPedia: Gen http://genomebiology.com/2002/3/3/reviews/0004/abs... http://www.mdpi.com/journal/genes/ http://www.nature.com/articles/538275a http://www.nature.com/embor/journal/v8/n12/full/74... http://www.nature.com/encode/#/threads/characteriz... http://www.nature.com/nature/dna50/watsoncrick.pdf http://www.nature.com/nature/journal/v431/n7011/fu... http://www.nature.com/ng/journal/v36/n9/full/ng090... http://www.nature.com/scitable/knowledge/library/n... http://www.nature.com/scitable/knowledge/library/p...